Accelerating Neural Network Inference With Processing-in-DRAM: From the Edge to the Cloud
نویسندگان
چکیده
Neural networks (NNs) are growing in importance and complexity. An NN’s performance (and energy efficiency) can be bound either by computation or memory resources. The processing-in-memory (PIM) paradigm, where is placed near within arrays, a viable solution to accelerate memory-bound NNs. However, PIM architectures vary form, different approaches lead tradeoffs. Our goal analyze, discuss, contrast dynamic random-access (DRAM)-based for NN efficiency. To do so, we analyze three state-of-the-art architectures: 1) UPMEM, which integrates processors DRAM arrays into single 2-D chip, 2) Mensa, 3-D-stacking-based architecture tailored edge devices, 3) SIMDRAM, uses the analog principles of execute bit-serial operations. analysis reveals that greatly benefits NNs: UPMEM provides 23× high-end graphics processing unit (GPU) when GPU requires oversubscription general matrix–vector multiplication kernel, Mensa improves efficiency throughput 3.0× 3.1× over baseline Edge tensor 24 Google models, SIMDRAM outperforms central unit/graphics 16.7×/1.4× binary We conclude ideal models depends on model's distinct attributes, due inherent architectural design choices.
منابع مشابه
from linguistics to literature: a linguistic approach to the study of linguistic deviations in the turkish divan of shahriar
chapter i provides an overview of structural linguistics and touches upon the saussurean dichotomies with the final goal of exploring their relevance to the stylistic studies of literature. to provide evidence for the singificance of the study, chapter ii deals with the controversial issue of linguistics and literature, and presents opposing views which, at the same time, have been central to t...
15 صفحه اولanalysis of power in the network society
اندیشمندان و صاحب نظران علوم اجتماعی بر این باورند که مرحله تازه ای در تاریخ جوامع بشری اغاز شده است. ویژگیهای این جامعه نو را می توان پدیده هایی از جمله اقتصاد اطلاعاتی جهانی ، هندسه متغیر شبکه ای، فرهنگ مجاز واقعی ، توسعه حیرت انگیز فناوری های دیجیتال، خدمات پیوسته و نیز فشردگی زمان و مکان برشمرد. از سوی دیگر قدرت به عنوان موضوع اصلی علم سیاست جایگاه مهمی در روابط انسانی دارد، قدرت و بازتولید...
15 صفحه اولthe role of russia in transmission of energy from central asia and caucuses to european union
پس ازفروپاشی شوروی،رشد منابع نفت و گاز، آسیای میانه و قفقاز را در یک بازی ژئوپلتیکی انرژی قرار داده است. با در نظر گرفتن این منابع هیدروکربنی، این منطقه به یک میدانجنگ و رقابت تجاری برای بازی های ژئوپلتیکی قدرت های بزرگ جهانی تبدیل شده است. روسیه منطقه را به عنوان حیات خلوت خود تلقی نموده و علاقمند به حفظ حضورش می باشد تا همانند گذشته گاز طبیعی را به وسیله خط لوله مرکزی دریافت و به عنوان یک واس...
15 صفحه اولAccelerating Training of Deep Neural Networks via Sparse Edge Processing
We propose a reconfigurable hardware architecture for deep neural networks (DNNs) capable of online training and inference, which uses algorithmically pre-determined, structured sparsity to significantly lower memory and computational requirements. This novel architecture introduces the notion of edge-processing to provide flexibility and combines junction pipelining and operational paralleliza...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: IEEE Micro
سال: 2022
ISSN: ['1937-4143', '0272-1732']
DOI: https://doi.org/10.1109/mm.2022.3202350